janvier 2022
Nous sommes cinq étudiants en dernière année à Polytech, Nice-Sophia specialisés en Architecture Logicielle :
Les projets informatiques prennent de plus en plus d’ampleur au fil des années. Avec cette prise d’ampleur vient généralement une augmentation de la complexité du projet. Cette complexité se retrouve dans le code du projet mais également dans sa maintenance.
En effet, il faut pouvoir builder et tester de telles applications. Ainsi, afin d’économiser du temps de travail (et de l’argent, évidemment) des outils d’intégration continue ont été développés. Ces outils sont, désormais, très développés et personnalisables, pour s’adapter au mieux aux besoins de leurs utilisateurs.
Le projet a pour but d’explorer et d’étudier la configurabilité de ces outils. Ainsi, nous pourrons fournir, aux personnes curieuses de savoir comment certaines entreprises s’assurent que leur(s) logiciel(s) fonctionne(nt) correctement sur plusieurs plateformes, un document répondant à ces interrogations.
Notre question :
Comment configure-t-on une chaîne d’intégration continue pour s’assurer du bon fonctionnement d’un logiciel dans différents environnements ?
Pourquoi cette question est intéressante à nos yeux :
Peu importe le niveau d’abstraction que l’on a par rapport à la machine, les applications destinées au grand public ont toujours besoin d’être testées sur plusieurs plateformes afin de garantir une utilisation optimale pour un très grand nombre d’utilisateurs. Pour n’importe quel type de CPU, d’OS ou de version d’un compilateur, l’application doit être buildée et testée. Ces actions doivent être faites de manière automatique afin de ne pas perdre de temps à chaque nouvelle version de l’application, à chaque nouveau merge, à chaque nouveau push. Ainsi, nous voulons comprendre comment les sociétés créant de telles applications configurent leur chaîne d’intégration continue pour les builder et les tester sur toutes les plateformes qu’ils ciblent.
Pour nous aider à essayer de répondre à cette question, nous avons défini 3 sous-questions :
Nous avons eu 4 grandes sources d’information pendant la durée de ce projet.
Afin de répondre aux questions posées précédemment, nous allons énoncer 3 hypothèses correspondants à ces dernières :
A. Les pipelines et les outils d’intégration continue se configurent différemment.
B. Les outils d’intégration continue fournissent des fonctionnalités pour minimiser les conséquences négatives d’un nombre élevé de jobs.
C. L’ajout de nouvelles pipelines permet de garantir un plus grand nombre d’utilisateurs potentiels.
Pour vérifier la validité de ces hypothèses, nous avons cherché des informations sur plusieurs projets, et nous allons détailler nos recherches et le résultat de ces dernières.
Pour tester et vérifier cette hypothèse, il suffisait de regarder du côté du code source (configuration de la pipeline au travers d’un fichier .yml par exemple) et du côté de l’outil d’intégration continue (définition au travers d’une interface graphique ou d’une CLI).
Nous prendrons ici comme exemple Cassandra et Maven, deux gros projets de la fondation Apache qui utilisent Jenkins. L’avantage de ces projets est qu’ils sont open source et que nous avons accès à l’interface graphique de l’outil Jenkins.
Dans les deux projets, nous voyons que les Jenkinsfiles définissent les différentes steps que doivent faire les agents. Dans ces fichiers sont également définis sur quelle(s) plateforme(s) ou avec quel(s) framework(s) ces steps doivent être exécutées.
Il est également possible de définir d’autres paramètres fournis par la chaîne d’intégration continue et qui peuvent se révéler utiles lors de l’exécution.
Par exemple : la définition d’un timeout.
Cependant, aucune définition des agents n’est faite dans ce fichier ou dans n’importe quel autre fichier du dépôt. Seul un identifiant permettant de savoir à quel type de worker assigner le travail apparaît.
Mais alors où sont définis ces agents ? Nous pouvons les voir “de l’autre côté”, sur l’interface graphique de ces projets. En effet, là-bas, nous pouvons voir une cinquantaine de workers alloués au projet Cassandra et une dizaine alloués au projet Maven.
En explorant la documentation de Jenkins, nous avons découvert l’architecture master/agent. C’est une architecture distribuée qui permet de répondre à une montée en charge mais également de définir différents environnements.
Le master est le serveur principal de Jenkins, qui se charge de la planification et de la répartition des jobs, de monitorer les agents, d’enregistrer les résultats des builds et autres.
Les agents sont les workers, ce sont des exécutables qui écoutent les directives du master.
Mais pourquoi existe-t-il une cinquantaine de workers pour le projet Cassandra ? Nous allons répondre à cette question en testant et prouvant notre deuxième hypothèse.
S’il existe un aussi grand nombre de workers pour le projet Cassandra, c’est que ce projet est massif et qu’il est devenu nécessaire de maintenir stable plusieurs versions de ce dernier. S’il y avait trop peu de workers, les jobs finiraient par attendre dans une queue de plus en plus longue et la vérification du bon fonctionnement de l’application finirait par être trop délayé pour être utile. Ainsi, avoir un grand nombre de workers permet de s’assurer d’en avoir assez dans le cas où toutes les versions du projet ont besoin d’être buildées et testées en même temps.
Mais répondre à cette sous-question et vérifier cette hypothèse ne passe pas seulement par le fait d’avoir un grand nombre de workers. Nous avons donc continué de chercher dans les projets et dans la documentation de Jenkins.
Ainsi, nous avons trouvé, dans les recommandations de Jenkins, qu’il fallait éviter de demander aux masters d’effectuer un quelconque job afin qu’ils puissent, à temps plein, s’occuper de l’assignation des jobs aux workers.
Si cette recommandation peut paraître logique, d’autres recommandations comme le fait de configurer le niveau de logs des workers ou programmer la suppression de l’historique des jobs en fonction de leurs fréquences ne sont peut-être pas des réflexes que les utilisateurs ont. De plus, ces recommandations, en plus d’être de bons conseils pour une utilisation optimale de l’outil, permettent de voir l’étendu des fonctionnalités rendues disponibles par les outils d’intégration continue.
Toujours avec l’exemple de Jenkins et des projets de la fondation Apache, nous avons eu la possibilité de voir qu’il est possible de configurer Jenkins pour un ensemble de projets. Il s’agit de la stratégie par organisme. En effet, en plus de Maven et de Cassandra, HBase, Hadoop et Beam sont également disponibles dans le même organisme.
De plus, il est possible d’avoir plusieurs “versions” d’un même organisme. Cela permet d’avoir un environnement pour les QA et un pour les développeurs par exemple et est potentiellement intéressant pour les grands projets où il y a de nombreuses équipes.
Après une exploration de ce regroupement de projets, nous avons pu voir que les machines (nodes dans le vocabulaire Jenkins) sont en fait partagées entre les différents projets. Ceci est fait afin de pouvoir optimiser le nombre total de nodes (puisqu’une machine effectuant un travail coûte de l’argent).
Pour conclure sur cette partie, l’outil Jenkins met, à la disposition de l’utilisateur, un éventail de fonctionnalités afin de minimiser les conséquences négatives d’un grand nombre de jobs.
Nous reviendrons sur ces résultats dans la partie dédiée à celà.
Pour vérifier cette hypothèse, nous avons regardé les chaînes d’intégration continue qui ont des jobs qui buildent et testent des applications sur plusieurs plateformes et/ou frameworks.
Nos recherches nous ont d’abord amené à l’interface graphique de la chaîne d’intégration continue de Spring Boot.
Sur cette dernière, nous avons vu qu’ils avaient des jobs pour plusieurs versions du jdk, mais aussi des jobs spécifiques pour Windows.
Nous avons alors cherché, dans leur dépôt GitHub, une raison de l’existence de tous ces jobs. Les recherches les plus fructueuses furent sur la raison de l’existence du job testant l’application sur Windows.
En effet, l’existence de ce job est né d’une issue GitHub reportant un bug de l’application n’ayant lieu QUE sous le système d’exploitation Windows.
Il est intéressant de noter que d’autres projets, tels que Conan (un outil de gestion de paquets C/C++) ont rencontré des problèmes avec Windows.
À partir de là, nous avons cherchés les issues signalant des erreurs n’ayant lieu que sous Windows, et nous avons trouvés plus de 130,000 issues.
Pour mettre ce chiffre en perspective, la même recherche avec Linux retourne 62,000 issues.
Toujours avec le même outil de recherche, nous avons trouvé 30,000 issues ayant comme titre Add Windows CI
, alors qu’il n’y en a que 6,000 avec le titre Add Linux CI
.
Ainsi, nous pouvons en déduire que l’ajout de nouveaux jobs peut répondre aux besoins des utilisateurs des applications, qu’ils aient été anticipés ou non par les développeurs.
(situation anticipée = nouvelle version avec nouvelle version du framework
situation non-anticipée = changement ne fonctionnant pas sous Windows)
Comme mentionné précédemment, nous avons utilisé l’API GitHub afin de rechercher des informations dans les dépôts publics permettant de confirmer (ou d’infirmer) nos hypothèses et nous permettant d’avancer dans nos recherches.
En plus de la recherche précédente, nous avons également utilisé cet outil afin de rechercher d’autres éléments relatifs aux chaînes d’intégration continue dans des projets open source. La force de cet outil est que nous avons pu préciser le langage utilisé, le sujet du gist,etc… Cela nous a permis d’avoir un moteur de recherche flexible sur les critères de recherche, donc un moteur de recherche puissant.
Tout au long de notre démarche, nous avons également utilisé GitHub pour avoir accès aux dépôts de projets open source.
Nous avons sélectionné les projets open source qui nous paraissaient être en adéquation avec le sujet et qui nous permettraient, à terme, d’apporter des éléments de réponses à nos différentes interrogations.
Il y a également d’autres éléments fournis par la plateforme que nous avons pu utiliser dans nos recherches, tels que les branches, qui permettent d’identifier des fonctionnalités, les types de livraison ou encore les tâches.
Nous nous sommes également servis du backlog de certains projets. Cela s’est révélé crucial dans nos recherches puisque, grâce à ce dernier, nous avons pu identifier manuellement des issues décrivant des problématiques qui nous intéressaient.
Enfin, nous avons principalement parlé des projets de la fondation Apache et de Jenkins car ces projets avaient une taille allant de grand (51 branches et 11,500 commits pour maven) à énorme (303 branches et 26,000 commits pour Hadoop).
De plus, lors de l’exploration de l’interface graphique de leur Jenkins, nous nous sommes rendus compte de la complexité générale de l’organisation de leur outil d’intégration continue. Cela nous a permis de répondre à notre deuxième sous-question.
Au fur et à mesure que nous explorions ces projets et leur outil d’intégration continue, nous nous sommes rendu compte que beaucoup des informations que nous trouvions étaient des éléments de réponse pour la première sous-question, d’où son utilisation en tant qu’exemple dans l’hypothèse A ci-dessus.
Nos résultats sont assez peu nombreux, en raison de la recherche majoritairement manuelle que nous avons effectuée.
Pour les deux premières hypothèses (et donc les deux premières sous-questions) nous avons principalement utilisé les projets de la fondation Apache, l’interface graphique Jenkins de ces projets et la documentation de l’outil Jenkins. Les résultats sont peu nombreux mais satisfaisants ! Néanmoins, nous sommes conscients que l’analyse détaillée d’autres projets aurait permis de donner du relief à nos résultats.
Pour la deuxième hypothèse, nous avons vu plusieurs fonctionnalités implémentées dans le les projets de la fondation Apache, mais une majorité au travers de la documentation. Trouver une implémentation de toutes ces fonctionnalités aurait pu nous donner un retour des potentielles complications que les développeurs auraient pu avoir avec ces fonctionnalités. Comme pour la première sous-question, plus de résultats auraient permis de donner du relief à nos résultats.
Cependant, nos recherches furent longues et méticuleuses, et nous manquions simplement de temps pour fournir le même travail sur un autre projet implémentant un autre outil d’intégration continue.
Ensuite, la troisième hypothèse et sa sous-question correspondante.
En raison des quelques métriques que nous avons pu dégager, nous pouvons déduire qu’une plus grande partie des projets n’incluent pas de pipeline Windows, et que les tests sur cette plateforme sont moins nombreux.
Il est important de souligner que, malgré l’utilisation d’un outil ou d’un framework qui devrait rendre le code indépendant de l’OS, il reste des différences colossales entre les différents OS, tels que l’arborescence de fichiers ou la gestion des permissions. Un autre problème que nous avons vu lors de nos recherches est un ancien problème avec WSL, où un long double était encodé sur 64 bits, alors que sur Linux, il est encodé sur 80 bits.
Ce que cette sous-question nous a appris est qu’il est important de bien tester les applications que l’on développe, ou, au moins, de vérifier que les outils / bibliothèques / frameworks utilisés le sont.
Finalement, toutes ces questions et ces recherches nous ont permis d’en savoir plus sur les outils d’intégration continue et nous ont permis d’en savoir plus sur leur configurabilité.
Il reste encore beaucoup de sous-questions découlant de notre question principale qui restent sans réponses, mais nous sommes fiers de notre travail et de ce que nous avons produit.
Nous avons déjà mentionné l’utilisation de l’API GitHub de recherche lors des parties précédentes. Vous trouverez ici deux exemples de nos recherches.
https://api.github.com/search/repositories?q=topic:JenkinsFile+language:* https://github.com/search?q=%22fail+on+windows%22&type=Issues
Détails de la plupart des sources (certaines n’ayant pas été notées sur le coup et n’ayant pas été retrouvées) utilisées lors de nos recherches :